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PR0M0TEUR DU GENE DE U PYRUVATE 
DECARBOXYLASE DE K LACTIS ET SON UTILISATION. 

La presente invention concerne le domaine de la biologie 
moleculaire. Plus parti culierement, elle concerne une nouvelle sequence 
d'ADN presentant une activite de promoteur transcriptionnel, des vecteurs 
5 d'expression contenant cette sequence, et son utilisation pour la production 
de proteines recombinantes, et par exemple de proteines heterologues. 
L'invention concerne aussi les cellules recombinees contenant cette sequence 
d'ADN. 

Les progr&s accomplis dans le domaine de la biologie moleculaire ont 

10 permis de modifier des microorganismes pour leur faire produire des 
proteines heterologues. En particulier, de nombreuses etudes genetiques ont 
porte sur la bacterie Ecoli. Toutefois, 1'application industrielle de ces 
nouveaux modes de production est encore limitee, en particulier par les 
problemes d'efficacite d'expression des genes dans ces microorganismes 

15 recombines. Aussi, dans le but d'augmenter les performances de ces systemes 
de production, des recherches ont ete effectuees afin d'isoler des promoteurs 
forts, permettant d'obtenir des niveaux eleves d'expression de proteines 
heterologues. Chez Ecoli, on peut citer en particulier les promoteurs des 
operons tryptophane et lactose. 

20 Plus recemment, chez la levure Sxerevisiae, des etudes ont porte sur 

des promoteurs derives de genes impliques dans la glycolyse. On peut citer 
notamment les travaux sur le promoteur du gene de la 3-phosphoglycerate 
kinase PGK (Dobson et al.. Nucleic Acid Res. 10, 1982, 2625; Hitzeman et al., 
Nucleic Acid Research 1982, 7791), sur celui du gene de la glyceral- 

25 dehyde-3-phosphate deshydrogenase GAPDH (Holland et al., J.Biol.Chem. 
254, 1979, 9839 ; Musti et al., Gene 25, 1983, 133), sur celui du gene de Talcool 
deshydrogenase 1 ADHi (Bennentzen et aL, J.Biol.Chem. 25L 1982, 3018 ; 
Denis et al., J.Biol.Chem. 25, 1983, 1165), sur celui du gene de Tenolase 1 
ENOl (Uemura et al., Gene 45, 1986, 65), sur celui du gene GAL1/GAL10 

30 (Johnston et Davis, Mol. Cell. Biol. 4 (1984) 1440) ou sur celui du gene CYC1 
(Guarente et Ptashne, PNAS 78 (1981) 2199). 

Recemment, des outils genetiques ont ete developpes afin de se servir 
de la levure Kluyveromyces comme cellule hote pour la production de 
proteines recombinantes. La mise en evidence d f un plasmide de type 
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2-micron originaire de K. drosophilarum (plasmide pKDl - EP 241 435) a 
permis d'etablir un systeme hote/vecteur tres efficace pour la production de 
proteines recombinantes. (EP 361 991). Cependant, les promoteurs utilises 
dans ce systeme riont pas ete optimises jusqu'a present. En particulier, il 

5 s'agit essentiellement de promoteurs heterologues, c'est-a-dire provenant 
d'autres microorganismes, tel que notamment Sxerevisiae. Cette situation peut 
engendrer differents inconvenients, et notamment limiter l'activibe du 
promoteur a cause de l'absence de certains elements de la machinerie 
transcriptionnelle (par exemple de trans-activateurs), presenter une certaine 

10 toxicity pour la cellule hote due a une absence de regulation, ou affecter la 
stabilite du vecteur. 

Dans ces conditions, le manque de promoteurs homologues forts 
chez Kluyveromyces constitue un facteur limitant dans l'exploitation 
industrielle de ce systeme depression. 

15 La Demanderesse a main tenant identifie, done et sequence une 

region du genome de Kluyveromyces lactis presentant une activite de 
promoteur transcriptionnel (voir SEQ ID n° 1). Plus predsement, cette region 
correspond au promoteur du gene codant pour la pyruvate-decarboxylase de 
K. lactis (K1PDC1). Cette region, ou des derives ou fragments de celle-d, peut 

20 etre utilisee de maniere tres performante pour la production de proteines 
recombinantes chez les levures du genre Kluyveromyces. II est entendu que 
cette sequence peut egalement etre utilisee dans d'autres organismes hotes. 

Par ailleurs, un avantage de la region promotrice obtenue reside dans 
l'absence de repression par le glucose, permettant une utilisation dans des 

25 milieux de culture dassiques et industriels. 

Un objet de la presente invention reside done dans une sequence 
d'ADN comprenant tout ou partie de la sequence SEQ ID n° 1 ou de son brin 
complementaire, ou d'un derive de celles-ci, et possedant une activite de 
promoteur transcriptionnel. 

30 Au sens de la presente invention, on entend par derive, toute 

sequence obtenue a partir de la sequence SEQ ID n° 1 par modification(s) de 
nature genetique et/ou chimique, conservant une activite de promoteur. Par 
modification de nature genetique et/ou chimique, on entend toute mutation, 
deletion, substitution, addition, et/ou modification d f un ou plusieurs 

35 nucleotides. De telles modifications peuvent etre effectuees dans differents 
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buts, et notanunent celui de preparer des promoteurs portables, ou celui de 
preparer des promoteurs adaptes a 1'expression dans un type particuiier de 
vecteur ou d'hote, celui de reduire la taille, d'augmenter l'activite de 
promoteur de la transciption, de generer des promoteurs inductibles, 
5 d'ameliorer le niveau de regulation, ou encore de changer la nature de la 
regulation. De telles modifications peuvent etre effectuees par exempie par 
mutagenese in vitro, par introduction d'elements additionnels de controle ou 
de sequences synthetiques, ou par des deletions ou des substitutions des 
Elements originels de controle. 

10 Lorsqu'un derive tel que defini ci-dessus est realise, son activite de 

promoteur transcriptionnel peut etre mise en evidence de plusieurs fa^ons, et 
en particuiier en pla^ant sous le controle de la sequence etudiee, un gene 
reporteur dont 1'expression est detectable. Toute autre technique connue de 
Thomme de Tart peut bien evidemment etre utilisee a cet effet. 

15 La sequence SEQ ID n° 1 a ete obtenue a partir d'une banque de 

fusion entre des fragments du genome de IClactis 2359/152 et le gene lacZ de 
Exoli selon le protocole decrit dans les exemples. II est entendu que Thomme 
du metier peut isoler cette region par hybridation au moyen d'une sonde 
comprenant tout ou partie de la sequence SEQ ID n° 1 ou de son brin 

20 complementaire. Les derives selon Tinvention peuvent ensuite etre prepares 
a partir de cette sequence, comme indique dans les exemples: 

Un autre objet de 1'invention concerne un ADN recombinant 
comprenant une sequence d'ADN telle que definie ci-dessus. 

Cet ADN recombinant peut contenir par exempie la sequence 
25 promotrice SEQ ID n° 1 ou un derive de celle-ci, dans laquelle est insere un 
site de restriction, facilitant l'utilisation de cette sequence comme promoteur 
"portable" (SEQ ID n° 3). 

Preferentiellement, cet ADN recombinant contient en outre un ou 
plusieurs genes de structure. En particuiier, il peut s'agir de genes codant 
30 pour des proteines d'interet pharmaceutique ou agroalimentaire. A titre 
d'exemple, on peut citer les enzymes (tels que notamment la superoxide 
dismutase, la catalase, les amylases, les lipases, les amidases, la chymosine, 
etc), les derives sanguins (tels que la serum-albumine, l'alpha- ou la beta- 
globine, le facteur VIII, le facteur IX, le facteur de von Willebrand, la 
35 fibronectine, Talpha-1 antitrypsine, etc), Tinsuline et ses variants, les 
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lymphokines (telles que les interleukines, les interferons, les facteurs de 
stimulation des colonies (G-CSF, GM-CSF, M-CSF...], le TNF, le TRF, etc), les 
facteurs de croissance (tels que l'hormone de croissance, Terythropoietine, le 
FGF, I'EGF, le PDGF, le TGF, etc), les apolipoproteines, des polypeptides 
5 antigeniques pour la realisation de vaccins (hepatite, cytomegalovirus, 
Eppstein-Barr, herpes, etc), ou encore des fusions de polypeptides telles que 
notamment des fusions comportant une partie active fusionnee a une partie 
stabilisatrice (par exemple des fusions entre l'albumine ou des fragments 
d'albumine et le recepteur ou une partie d'un recepteur de virus [CD4, etc]). 

10 Encore plus preferentiellement, l'ADN recombinant contient 

egalement des signaux permettant la secretion du produit depression du ou 
desdits genes de structure. Ces signaux peuvent correspondre aux signaux 
naturels de secretion de la proteine consideree, mais ils peuvent etre d'une 
origine differente. En particulier des signaux de secretion derives de genes 

15 de levure peuvent etre utilises, tels que ceux des genes de la toxine killer 
(Stark et Boyd, EMBO J. 5 (1986) 1995) ou de la pheromone alpha (Kurjan et 
Herskowitz, Cell 30 (1982) 933; Brake et al., Yeast 4 (1988) S436). 

Dans un mode de realisation particulier de l'invention, l'ADN 
recombinant fait partie d'un plasmide d'expression, qui peut etre a 

20 replication autonome ou integratif. 

En particulier, des vecteurs a replication autonome peuvent etre 
obtenus en utilisant des sequences a replication autonomes chez l'hote choisi. 
Notamment, chez la levure, il peut s'agir d'origines de replication derivees de 
plasmides (pKDl, 2p, etc), ou bien de sequences chromosomiques (ARS). 

25 Les vecteurs integratifs peuvent etre obtenus notamment en utilisant 

des sequences homologues a certaines regions du genome de Thote, 
permettant, par recombinaison homologue, l'integration du vecteur. 

Un autre objet de Tinvention concerne les cellules recombinees 
contenant une sequence d' ADN telle que definie ci-avant 

30 Avantageusement, les cellules sont choisies parmi les levures, et 

encore plus preferentiellement, parmi les levures du genre Kluyveromyces. II 
est entendu cependant que ['invention couvre toutes les cellules recombinees 
dans lesquelles les regions promotrices de l'invention sont actives, qu'il 
s'agisse de cellules eucaryotes ou procaryotes. Ainsi, parmi les cellules 

35 eucaryotes, on peut citer les cellules vegetales, animales, les levures, ou les 
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champignons. En particulier, s'agissant de levures, on peut titer les levures 
du genre Saccharotnyces, Pichia, Schxvanniomyces, ou Hartsenula. S'agissant de 
cellules ani males, on peut titer les cellules COS, CHO, C127, etc. Parmi les 
champignons susceptibles d'etre utilises dans la presente invention, on peut 

5 titer plus particulierement Aspergillus ssp. ou Trichoderma ssp. Comme hotes 
procaryotes, on peut utiliser les bacteries telles que Escherichia coli, ou celles 
appartenant aux genres Corynebacterium, Bacillus, ou Streptomyces. 

Uactivite de promoteur de la transcription des sequences de 
l'invention dans ces differents hotes peut etre verifiee par exemple en 

10 introduisant dans la cellule hote consideree un ADN recombinant 
comprenant, sous le controle de la sequence promotrice etudiee, un gene 
reporteur dont 1'expression peut etre mise en evidence dans l'hote considere. 

Les cellules recombinees de l'invention peuvent etre obtenues par 
toute methode permettant d'introduire un ADN etranger dans une cellule. II 

15 peut s'agir notamment de transformation, electroporation, conjugaison, 
fusion de protoplastes ou toute autre technique connue de l'homme de l'art 
S'agissant de la transformation, differents protocoles ont ete decrits dans Tart 
anterieur. En particulier, elle peut etre realisee en traitant les cellules entieres 
en presence d'acetate de lithium et de polyethylene glycol selon la technique 

20 decrite par Ito et al. (J. Bacteriol. 153 (1983) 163-168), ou en presence 
d'ethylene glycol et de dimethylsulfoxyde selon la technique de Durrens et 
al. (Curr. Genet. 18 (1990) 7). Un protocole alternatif a egalement ete decrit 
dans la demande de brevet EP 361 991. S'agissant d'electroporation, elle peut 
etre realisee selon Becker et Guarentte (in : Methods in Enzymology Voll94 

25 (1991) 182). 

Un autre objet de l'invention concerne l'utilisation d'une sequence 
telle que precedemment definie pour 1'expression de genes recombines. Les 
sequences d'ADN selon Tinvention peuvent en effet permettre une 
production a des niveaux eleves de proteines recombinantes. 
30 Avantageusement, les sequences de l'invention peuvent etre utilisees 

pour 1'expression de genes codant pour des proteines d'interet 
pharmaceutique ou agroalimentaire. A titre d'exemple, on peut titer les 
proteines enumerees precedemment 



i 
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La presente invention permet egalement ia realisation d'un procede 
de production de proteines recombinantes, selon lequel on cultive une cellule 
recombinee telle que definie ci-avant et on recupere la proteine produite. A 
titre d'exemple de proteine, on peut diter les proteines enumerees 
5 precedemment 

Preferentiellement, le procede de 1'invention est applicable a la 
production de serum-albumine humaine, ou un de ses variants moleculaires. 
On entend par variant moleculaire de l'albumine, les variants naturels 
resultant du polymorphisme de l'albumine, les formes tronquees, ou toute 
10 proteine hybride & base d'albumine. 

D'autres a vantages de la presente invention apparaitront k la lecture 
des exemples qui suivent, qui doivent Stre consideres comme illustradfs et 
non limitatifs. 



15 LEGENDE DES FIGURES 

SEP ID n°l : Sequence nucleotidique du fragment de 1,2 kb correspondant 

au promoteur K1 PDC1 de K. lactis . 
Figure 2 : Preparation du transposon Mini Mu MudllZKl. 
20 Figure 3 : Carte de restriction du transposon Mini Mu MudllZKl. 
Figure 4 : Carte de restriction du clone 1D12. 

Figure 5 : Carte de restriction du fragment de BamHI-HindHI de 2,05 kb 
portant le promoteur K1 PDCL 

25 TECHNIQUES GENERALES DE CLONAGE 

Les methodes classiquement utilisees en biologie moleculaire telles 
que les extractions preparatives d'ADN plasmidique, la centrifugation 
d'ADN plasmidique en gradient de chlorure de cesium, l'electrophorese sur 
gels d'agarose ou d'acrylamide, la purification de fragments d'ADN par 
30 electroelution, les extraction de proteines au phenol ou au phenol- 
chloroforme, la precipitation d'ADN en milieu salin par de Tethanol ou de 
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l'isopropanol, la transformation dans Escherichia coli etc, sont bien connues de 
Thomme de metier et sont abondament decrites dans la litterature [Maniatis 
T. et al., "Molecular Cloning, a Laboratory Manual", Cold Spring Harbor 
Laboratory, Cold Spring Harbor, N.Y., 1982; Ausubel RM. et al. (eds), 
5 "Current Protocols in Molecular Biology", John Wiley & Sons, New York, 
1987]. 

Les enzymes de restriction ont ete fournies par New England Biolabs 
(Biolabs), ou Pharmacia et sont utilisees selon les recommandations des 
fournisseurs. 

10 Les plasmides de type pBR322 et pUC sont d'origine commerciale 

(Bethesda Research Laboratories). 

Pour les ligatures, les fragments d'ADN sont separes selon leur taille 
par electrophorese en gels d'agarose ou d'acrylamide, extraits au phenol ou 
par un melange phenol/chloroforme, precipites a l'ethanol puis incubes en 
15 presence de 1'ADN ligase du phage T4 (Boehringer) selon les 
recommandations du fournisseur. 

Le remplissage des extremites 5' proeminentes est effectue par le 
fragment de Klenow de l'ADN Polymerase I d'E. coli (Boehringer) selon les 
specifications du fournisseur. La destruction des extremites 3* proeminentes 
20 est effectuee en presence de l'ADN Polymerase du phage T4 (Biolabs) utilisee 
selon les recommandations du fabricant. La destruction des extremites 5' 
proeminentes est effectuee par un traitement menage par la nuclease SI. 

La mutagenese dirigee in vitro par oligodeoxynudeotides synthetiques 
est effectuee selon la methode developpee par Taylor et al. [Nucleic Acids 
25 Res. 13 (1985) 8749-8764]. 

^amplification enzymatique de fragments d'ADN par la technique 
dite de PCR [Polymerase-catalyzed Chain Reaction, Saiki R.K. et al., Science 
230 (1985) 1350-1354; Mullis K.B. et Faloona F.A., Meth. Enzym. 155 (1987) 
335-350] est effectuee en utilisant un "DNA thermal cycler" (Perkin Elmer 
30 Cetus) selon les specifications du fabricant. 

La verification des sequences nudeotidiques est effectuee par la 
methode developpee par Sanger et al. [Proc. Natl. Acad. Sci. USA, 74 (1977) 
5463-5467]. 

Les transformations de K lactis sont effectuees par toute technique 
35 connue de l'homme de Tart, et dont un exemple est donne dans le texte. 
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Sauf indication contraire, les souches bacteriennes utilisees sont Ecoli 
DH1 (Hanahan D., J. Mol. Biol. 166 (1983) 557) ou Ecoli JM109::(Murts) 
(Daignan-fornier et Bolotin-Fukuhara, Gene 62 (1988) 45). 

Les souches de levures utilisees appartiennent aux levures 
5 bourgeonnantes et plus particulierement aux levures du genre Kluyveromyces. 
Les souehe K lactis 2359/152 etK lactis SD6 ont ete particulierement utilisees. 

Les souches de levures transformees par les plasmides sont cultivees 
en erlenmeyers ou en fermenteurs pilotes de 21 (SETRIC, France) & 28°C en 
milieu riche (YPD: 1% yeast extract, 2% Bactopeptone, 2% glucose; ou YPL: 
10 1% yeast extract, 2% Bactopeptone, 2% lactose) sous agitation constante. 

EXEMPLES 



I - Isolement du promoteur K1PDC1 de K. lactis. 

15 

La sequence SEQ ID n° 1 a ete isolee a partir d'une banque de fusion 
entre des fragments du genome deKkctts 2359/152 et le gene lacZ de Ecoli. 
Get exemple decrit en (A) la preparation de la banque de fusion, et en (B) la 
selection et la caracterisation d'un clone de cette banque portant le promoteur 
20 du gene de la pyruvate decarboxylase de IClactis. 

AJ Preparation de la banque de fusion 

A.l. Preparation du transposon Mini Mu MudllZKl (figures 2 et 3). 

Le Mini Mu MudllZKl a 6te construit a partir du Mini Mu MudllZZl 
25 decrit par Daignan-Fornier et Bolotin-Fukuhara (Gene 62 (1988) 45). II a ete 
obtenu en substituant Torigine de replication du mini transposon MudllZZl 
par une origine de replication fonctionnelle dans Kluyverpmyces : Torigine de 
replication du plasmide pKDl (EP231 435). 

A.1.1. Construction d'une cassette portant 1'origine de replication du 
30 plasmide pKDl (fragment Sll). 
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Afin de faciliter les manipulations ulterieures, le fragment Sll 
(portant 1'origine de replication du plasmide pKDl) a ete mis sous forme 
d'une cassette Notl. Pour cela, un derive du plasmide pUC18 a ete construit 
dans lequel les sites externes du multisite de donage (sites Hindlll et EcoRI) 
5 ont ete changes en sites Notl. Cela a 6te fait par digestion avec Tenzyme 
correspondante, action de Tenzyme de Klenow et ligature avec un 
oligonucleotide synthetique correspondant a un site Notl [oligo 
d(AGCGGCCGCT); Bioiabs]. Le plasmide obtenu est designe pGM67. Le 
fragment Sll de 960 pb obtenu par digestion par Tenzyme Sau3A du 
10 plasmide KEp6 (Chen et al, Nucl. Acids Res. 114 (1986) 4471) a ensuite ete 
insere au site compatible BamHI du plasmide pGM67. Le plasmide ainsi 
obtenu designe pGM68 contient, sous forme d'une cassette Notl, le fragment 
Sll. 

A.1.2. Suppression de Torigine de replication 2p du transposon 
15 MudllZZl. 

Le plasmide pGM15 portant le mini Mu MudllZZl (Daignan-Fornier 
et Bolotin-Fukuhara precitee) a ete delete des regions 2p par digestion au 
moyen de Tenzyme Sail. Le site Sail unique ainsi obtenu a ensuite ete 
transforms en site Notl par ligature d'un oligonucleotide synthetique 
20 correspondant a un site Notl apres action de Tenzyme de Klenow. Le 
plasmide resultant est appele pGM59. 

A.1.3. Insertion du fragment Sll 

La cassette Notl portant Torigine de replication du plasmide pKDl 
(fragment Sll), provenant du plasmide pUC18 modifie a ensuite ete 
25 introduce au site Notl unique du plasmide pGM59. 

Le plasmide obtenu, designe pGM83, porte un mini Mu, appele 
MudllZKl, qui est adapte a la levure Kluyveromyces lactis, ainsi qu'une copie 
fonctionnelle du gene LEU2 de S.cerevisiae capable de complementer une 
mutation leu2 chez KAactis (Kamper et al, Curr. Genet. 19 (1991) 109). La carte 
30 de restriction du mini-mu MudllZKl est representee sur la figure 3. 
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A.2. Introduction du Mini Mu MudllZKl dans la souche Ecoli 
portant le Mu helper JM109::(Mucts) : Obtention de la souche 
JM109::(Mucts)::(MudIIZKl). 

La souche JM109::(Mucts) a ete transforms par le plasmide pGM83 
5 contenant le mini mu MudllZKl en presence de chlorure de calcium. Apres 
transformation, la transposition a ete induite par choc thermique selon la 
technique decrite par Castilho et al. (J- Bacteriol. 158 (1984) 488). Le lysat 
phagique obtenu apres induction est ensuite utilise pour surinfecter la souche 
JM109::(Mucts). La souche JM109::(Mucts) etant recA, l'ADN lineaire 
10 encapside par le phage ne peut se refermer pour donner un plasmide 
replicatif. Les integrants [souche JM109::(Mucts)::(MudIIZKl)] sont done 
selectionnes comme clones chloramphenicol resistants (Cm R ), ampicilline 
sensibles (Amp s ). 

A.3. Preparation de la banque genomique deK.lactis dans Exoli DH1 

15 L'ADN de haut poids moleculaire a ete prepare a partir de la souche 

IClactis 2359/152, et digere partiellement par l'enzyme Sau3A. Les fragments 
d'une taille de 4 a 8 kb oht ete recuperes sur gel d'agarose LMP ("Low 
Melting Point", SEAKEM) et clones dans le plasmide pBR322 linearise par 
BamHI et dephosphoryle par action de la phosphatase intestinale de veau 

20 (Biolabs). 35 pools de 1000 colonies dans Ecoli DH1 ont ainsi ete realises. Us 
1000 colonies de chaque pool sont ampicilline-resistantes et tetracydine- 
sensibles, ce qui montre qu'elles ont toutes insere un fragment d'ADN 
genomique de tClactis dans pBR322. 

A.4. Preparation de la banque de fusion 

25 a.4.1. Introduction de la banque genomique de tLlactis dans la 

souche JM109::(Mucts)::(MudIIZKl). 

L'ADN plasmidique de chaque pool realise dans DH1 est extrait 

(Maniatis). Cet ADN est ensuite utilise pour transformer la souche 

JM109::(Mucts)::(MudIIZKl) en presence de chlorure de calcium. Pour etre 
30 representatif des 1000 colonies contenues dans chaque pool de la banque 

genomique, plus de 3000 clones par pool ont ete recuperes dans la souche 

JM109::(Mucts)::(MudIIZKl) permettant la transduction. 
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A. 4.2. Transposition du Mini Mu MudllZKl 

La banque de fusion est realisee par transposition extensive du Mini 
Mu MudllZKl sur les plasmides formant la banque d'ADN genomique de 
tLlactis. Les mini-muductions ont ete faites selon le protocole decrit par 

5 Castilho et al. (J. Bacteriol. 158 (1984) 488) et les transductants ont ete 
selectionnes sur milieu selectif LBAC (milieu LB (Gibco BRL) supplements 
avec 50 mg/1 d'ampicilline et 30 mg/1 de chloramphenicol), le marqueur 
Amp R etant apporte par le plasmide, et le marqueur Cm R par le mini-mu. 
Pour chaque pool, des transpositions sont faites en serie, et entre 10 000 et 20 

10 000 transductants sont recuperes par pool. L'ADN des transductants est 
ensuite extrait d'une preparation de 100 ml, purifie par precipitation au 
polyethylene glycol (Maniatis et al, 1989) et resuspendu dans lOOpl d'eau. Cet 
ADN a ensuite ete utilise pour transformer Mactis et selectionner des clones 
portanfc des promoteurs. 

15 B/ Isolement du promoteur K1 PDC1 de FLlactis 

L'ADN de fusion prepare ci-dessus a ete utilise pour transformer, par 
electroporation, une souche receptrice de K.lactis. Cette souche receptrice, 
designee SD6, porte les mutations leu2 (correspondant au marqueur de 
selection du mini-mu MudllZKl) et lac4-8. Cette derniere mutation empeche 

20 la souche de pousser sur un milieu contenant du lactose comme seule source 
de carbone, mais elle peut etre complementee par la surexpression du gene 
lacZ d'Ecoli codant pour la B-galactosidase (Chen et al., J. Basic Microbiol. 28 
(1988) 211). De ce fait, r expression d'une proteine fusionnee ^ la £- 
galactosidase doit permettre la croissance de la souche SD6 sur lactose apres 

25 transformation. Ce crible positif a ete utilise pour selectionner rapidement 
des clones portant des promoteurs forts. 

B. l. Construction de la souche receptrice Klactis SD6. 

La souche SD6 (Chen et al., Mol. Gen. Genet. 233 (1992) 97) a ete 
obtenue par croisement de la souche K.lactis CXJ1-7A (a, lac4-8, ura3A, adel- 
30 1, Kl, K2, pKDl) (Chen et Fukuhara, Gene 69 (1988) 181) avec la souche AWJ- 
137 (ieu2, trpl, homothallique) (Kamper et al, Curr. Genet. 19 (1991) 109), et 
selection des spores ayant le genotype ADE+, uraA, leu2, lac4-8. Comme les 
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spores obtenues n'etaient pas capables de regenerer apres tranformation par 
protoplastes, un croisement retour a ete fait avec la souche CXJ1-7A. Apres 
sporulation en masse, les spores du genotype choisi ont ete testees par 
transformation au chlorure de lithium avec le plasmide KEp6 selon une 
5 technique derivee de celle decrite par Ito et al. (J. Bacterid. 153 (1983) 163) (la 
concentration en LiCl est de 20 mM, soit 10 fois moins que celle utilisee par 
Ito pour Sxereuisiae). La souche CXJ1-7A a servi de temoin de transformation. 

La souche SD6, selectionnee sur ces cri teres, se transforme 
correctement : 1 & 3 . 10 4 transformants par pg d'ADN; et les transformants 
10 ont une stabilite satisfaisante : 30 a 40% des colonies gardent le phenotype 
(Ura+) apres 6 generations en milieu non selectif. 

B.2. Isolement du promoteur K1 PDCL 

15 La souche SD6 a ete transformee par electroporation selon Becker et 

Guarante (in Methods in Enzymology vo!194 (1991) 182) (appareil Jouan; 
2500 V/cm; 80-100 ng d'ADN /transformation) avec i'ADN de 11 pools de 
transductants obtenus en A.4.2. (correspondant a une banque de 11000 clones 
dans Ecoli). Apres 5 heures de regeneration eh milieu YPD (extrait de levure 

20 10 g/1; peptone 10 g/1; glucose 20 g/1), les cellules ont ete Stalees sur milieu 
minimum lactose. Les transformants capables de pousser sur lactose ont ete 
restries et r pour chaque clone, le plasmide a ete extrait, amplifie dans Ecoli, 
et, apres verification rapide de la carte de restriction du vecteur et du mini- 
mu, utilise pour retransformer la levure SD6. Parmi les clones de XLlactis 

25 obtenus apres retransformation, Tun d'entre-eux, le clone 1D12, a ete etudie 
par restriction (voir figure 4) et par analyse de la sequence de la jonction 
entre la proteine de K.lactis et la g-galactosidase. Pour cela, la sequence de la 
jonction, a partir de Textremite lacZ du mini-mu (sequence double brin) a ete 
determinee par sequence au moyen de Toligonucleotide suivant situe a -59 

30 nucleotides de la jonction : 

5'-CTGTTTCATTTGAAGCGCG-3 , (SEQ ID n° 2) 

L'analyse de la sequence proteique deduite de la sequence 
35 nucleotidique ainsi obtenue par comparaison avec les sequences de banques 
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de proteines d'autres levures ou eucaryotes (Genbank, MIPS, EMBL, etc), 
montre que la sequence portee par le clone 1D12 correspond au promoteur 
du gene de la pyruvate-decarboxylase de tilactis, Le fragment BamHI- 
Hindlll de 2,05 kb contenant la region en amont de la fusion a ensuite ete 

5 sous-done dans le vecteur Bluescript KS+ (Stratagene), une carte de 
restriction a ete faite (figure 5), et la sequence a ete determinee par deletions 
sequentielles sur 1,2 kb (SEQ ID n° 1). L'obtention d'elements de sequence 
permet egalement £ Thomme du metier de preparer des sondes specif iques et 
de redoner la region promotrice de 1'invention par hybridation selon les 

10 techniques dassiques de biologie moleculaire. 

II - Transformation de Kluyveromyces. 

Differentes techniques permettant Introduction d'ADN dans la 

levure peuvent etre utilisees. 
15 Avantageusement, les differentes souches de Kluyueromyces utilisees 

ont ete transformees en traitant les cellules entieres en presence d'acetate de 

lithium et de polyethylene glycol, selon la technique decrite par Ito et al. (J. 

Bacteriol. 153 (1983) 163-168). La technique de transformation decrite par 

Durrens et al. (Curr.Genet. 18 (1990) 7) utilisant 1'ethylene glycol et le 
20 dimethylsulfoxyde a egalement ete utilisee. II est aussi possible de 

transformer les levures par electroporation, par exemple selon la methode 

decrite par Karube et al. (FEBS Letters 182 (1985) 90). 

Un protocole alternatif a encore ete decrit en detail dans la demande 

EP 361 991. 

25 III- Utilisation du promoteur SEQ ID n° 1 pour Texpression de 
genes heterologues. 

L'activite de promoteur transcripdonnel de la region de IClactis decrite 
sur la SEQ ID n° 1 a ete mise en evidence lors meme de son isolement, par sa 
capadter a induire la complementation de la mutation lac4-8 de la souche 
30 SD6. Cette capadte resulte en effet de Texpression du gene lacZ de Exoli, et 
demontre par la meme la capadte d'expression de genes heterologues. 

IV - Construction d'un promoteur K1PDC1 portable (SEQ ID n° 3) 
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Un promoteur portable est prepare par PCR, par insertion sur le 
fragment BamHI-HindlH de 2,05 kb d'un site de restriction Hindlll en 
position +1 par rapport au codon ATG du gene K1 PDC1 et des sites de 
5 restriction Mlul et Sail a 1165 pb en amont (SEQ ID n° 3). Le produit de PCR 
est done dans le vecteur pCRII (Invitrogen) pour generer le plasmide 
pYG175, permettant de ressortir le promoteur par simple digestion Mlul- 
Hindlll, facilitant ainsi le clonage dans un vecteur d'expression. 

Un vecteur depression de la serum-albumine humaine est ensuite 

10 prepare a partir du plasmide pYG1018 comme suit : Le plasmide pYG1018 
contient le gene prepro-albumine sous controle du promoteur LAC4. II 
derive du vecteur pYG1023 decrit dans la demande de brevet EP 402 212, par 
deletion du fragment BssHII-MluI portant le gene K1PGK. 5 pg des vecteurs 
pCRII-Promoteur et pYG1018 sont digeres par 60 unites de Hindlll et de 

15 Mlul. Apres migration sur gel d'agarose a 0,8%, la bande correspondant au 
promoteur PDC1 (environ 1,2 kb), la bande correspondant a la partie vecteur 
(environ 9 kb) et la bande correspondant au cDNA de l'albumine (environ 2 
kb) sont electroeluees. Une ligation a 3 partenaires (suivant les 
recommandations de tampon et de temperatures definies par le fournisseur 

20 New England Biolabs) est ensuite effectuee avec 1 pi d'ADN promoteur, 1 pi 
d'ADN vectoriel, et 2 pi d'ADN albumine. Apres transformation chez E.coli 
(Chung et al NAR 16 (1988) 3580), i'ADN plasmidique des transformants est 
prepare selon la technique de lyse alcaline au SDS de Birboim et Doly (NAR 
6 (1979) 1513) modifiee par Ish-Horowicz et Burke (NAR 9 (1981) 2989). 

25 Apres digestion enzymatique, le plasmide possedant le bon profil de 
restricion est isole. Ce plasmide est designe pYG181. 

La souche K.lactis CBS 293.91 a ete transformee par pYG181 dans les 
conditions decrites dans 1'exemple II. La production d'albumine par plusieurs 
transformants est testee selon la technique decrite dans EP 361 991. La 

30 quantite d'albumine secretee par les transformants est similaire (50-100 mg/l). 
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LISTE DE SEQUENCES 



(1) INFORMATION GENERALE: 

(i) DEPOSANT: 

(A) NOM: RHONE- POULENC RORER S.A. 

(B) RUE: 20, avenue Raymond ARON 

(C) VILLE: ANTONY 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 92165 

(ii) TITRE DE L 1 INVENTION: Promoteur de levure et son utilisation, 
(iii) NOMBRE DE SEQUENCES: 3 

(iv) FORME LISIBLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Tape 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.25 (OEB) 



(2) INFORMATION POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1239 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE : NON 

(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(A) ORGANISME: Kluyveromyces lactis 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 11 77.. 1239 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID 
AAGCTTCCAG TCACATGACC TAGAATGCAT ATATTGTCCC 
CTTCTCTCTG CTTATCTCTG GTGCAGCCTC CTAGTTTTTC 
AAAATTCTCC GAAAATCGTC AGATATCCAG ATATGCAACA 
ATATCGATTT CAAAATGCAA ATAACGGCAA CTAAGCCCAT 
TCCATGCACG TCGTTCCCAC TGATGATTCC TCGGATCAGT 
GCCAAAGCAG ACATCCTCCA AGCCGTATCC CAGACAAATA 



NO: 1 : 



GGGTAATATA 


TAGCAACCGT 


60 


CGAAAAGTTT 




120 


TAGAGGGAAG 


ATACACCGTT 


180 


CACTCTCAGC 


ACGTTTCTTT 


240 


TGATGCGATT 


TTTAACAACA 


300 


CAACTCTATC 


TCTGTGAGGG 


360 
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ATTCGTGTAA 


ACTGGAATTC 


AGCTGAGGTA 


TTTCTTTTTA 


CAGGATTGCG 


CTTCCAGTAA 


420 


ATTCGGTCTG 


TTCCATTGCG 


ACTTGTTGAA 


TGGCATTGGC 


GATGCCAATC 


GCAATTCCAT 


480 


GGGCAACGAG 


TAAGTAAGTC 


TCTTCTACAT 


CGTCCTATTC 


CTTTCCTAAT 


GTGAGCTCTT 


540 


TTTACCTTTT 


GGTACCCATA 


CAACGAGTGT 


CATGGGGAGA 


GGAAGAGGAA 


GATTTTAGAT 


600 


GTAGTGAAAG 


TGAATAGATG 


AAATGGGAAA 


TGGGCGTGTG 


GTGCGGTTTC 


TGTGGTATAG 


660 


AAAATCGGAA 


ATGAGAGTCA 


ACCAAGGTAA 


AAGGTGGGAT 


AATTTCATGG 


TATTGGAAAT 


720 


TATTCAAATT 


AGCTAACCAT 


TGCTGGCCCT 


TGTGCGTGTC 


CTGTATTTTG 


CATATTCTGT 


780 


ATTTGCTATG 


TAGAACCATG 


GGATAGATTA 


TGCAATATTT 


GTGAAAAGAT 


TCAACCTTTT 


840 


AAGGTGTATA 


CGTAGTATTG 


GCCCATGAAT 


ATCTTAAGGT 


TGGAATAGTA 


GTACCACTTG 


900 


TGTCAATTAT 


CCATTAAGGG 


GGGAGAGTGA GGTGAGAGGC 


AGGGCTGGCT 


GGGTGGTGAA 


960 


TATGACCTTT 


CTATTTTTTT 


TAGTTAACTC 


AGATAAAGTA 


TAAATACATG 


GGCATGATTA 


1020 


TCTGTAATGG 


CTAGAGTTTC 


CCATCATGTC 


TTAATCATAA 


TCTTAATTAT 


ATACTTTTGA 


1080 


TTACCCTCAA 


AAACCATCCA 


CTAAAGCCAA 


ACATATTATA 


GTATTAACTA 


TTAATATTAA 


1140 


GGATAAAACT 


ACAACTCAAA 


ACCAACTTAA 


ATTACA ATG 
Met 


TCT GAA ATT ACA TTA 
Ser Glu lie Thr Leu 


1194 



1 5 

GGT CGT TAG TTG TTC GAA AGA TTA AAG CAA GTC GAA GTT CAA ACC 1239 

Gly Arg Tyr Leu Phe Glu Arg Leu Lys Gin Val Glu Val Gin Thr 
10 15 20 



(2) INFORMATION POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 
CTGTTTCATT TGAAGCGCG 19 

(2) INFORMATION POUR LA SEQ ID NO: 3: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 
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(A) LONGUEUR: 1184 paires de bases 

(B) TYPE: acide' nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADNc 

(iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 

(vi) ORIGINE: 

(A) ORGANISME: Kluyveromyces lactis 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 



ACGCGTGTCG 


ACAGCTTCCA 


GTCACATGAC 


CTAGAATGCA 


TATATTGTCC 


CGGGTAATAT 


60 


ATAGCAACCG 


TCTTCTCTCT 


GCTTATCTCT 


GGTGCAGCCT 


CCTAGTTTTT 


CCGAAAAGTT 


120 


TCTTTTTCTC 


CAAAATTCTC 


CGAAAATCGT 


CAGATATCCA 


GATATGCAAC 


ATAGAGGGAA 


180 


GATACACCGT 


TATATCGATT 


TCAAAATGCA 


AATAACGGCA 


ACTAAGCCCA 


TCACTCTCAG 


240 


CACGTTTCTT 


TTCCATGCAC 


GTCGTTCCCA 


CTGATGATTC 


CTCGGATCAG 


TTGATGCGAT 


300 


TTTTAACAAC 


AGCCAAAGCA 


GACATCCTCC 


AAGCCGTATC 


CCAGACAAAT 


ACAACTCTAT 


360 


CTCTGTGAGG 


GATTCGTGTA 


AACTGGAATT 


CAGCTGAGGT 


ATTTCTTTTT 


ACAGGATTGC 


420 


GCTTCCAGTA 


AATTCGGTCT 


GTTCCATTGC 


GACTTGTTGA 


ATGGCATTGG 


CGATGCCAAT 


480 


CGCAATTCCA 


TGGGCAACGA 


GTAAGTAAGT 


CTCTTCTACA 


TCGTCCTATT 


CCTTTCCTAA 


540 


TGTGAGCTCT 


TTTTACCTTT 


TGGTACCCAT 


ACAACGAGTG 


TCATGGGGAG 


AGGAAGAGGA 


600 


AGATTTTAGA 


TGTAGTGAAA 


GTGAATAGAT 


GAAATGGGAA 


ATGGGCGTGT 


GGTGCGGTTT 


660 


CTGTGGTATA 


GAAAATCGGA 


AATGAGAGTC 


AACCAAGGTA 


AAAGGTGGGA 


TAATTTCATG 


720 


GTATTGGAAA 


TTATTCAAAT 


TAGCTAACCA 


TTGCTGGCCC 


TTGTGCGTGT 


CCTGTATTTT 


780 


GCATATTCTG 


TATTTGCTAT 


GTAGAACCAT 


GGGATAGATT 


ATGCAATATT 


TGTGAAAAGA 


840 


TTCAACCTTT 


TAAGGTGTAT 


ACGTAGTATT 


GGCCCATGAA 


TATCTTAAGG 


TTGGAATAGT 


900 


AGTACCACTT 


GTGTCAATTA 


TCCATTAAGG 


GGGGAGAGTG 


AGGTGAGAGG 


CAGGGCTGGC 


960 


TGGGTGGTGA 


ATATGACCTT 


TCTATTTTTT 


TTAGTTAACT 


CAGATAAAGT 


ATAAATACAT 


1020 


GGGCATGATT 


ATCTGTAATG 


GCTAGAGTTT 


CCCATCATGT 


CTTAATCATA 


ATCTTAATTA 


1080 


TATACTTTTG 


ATTACCCTCA 


AAAACCATCC 


ACTAAAGCCA 


AACATATTAT 


AGTATTAACT 


11 40 


ATTAATATTA 


AGGATAAAAC 


TACAACTCAA 


AACCAACTAA 


GCTT 




1184 
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R EVENPICATIQNS 

1. Fragment d'ADN comprenant tout ou partie de la sequence SEQ 
ID n° 1 ou de son brin complementaire, ou d'un derive de celles-ci, et 
possedant une activite de promoteur transcriptionnel. 

2. ADN recombinant comprenant une sequence d'ADN selon la 
revendication 1. 

3. ADN recombinant selon la revendication 2 caracterise en ce qu'il 
contient en outre un ou piusieurs genes de structure. 

4. ADN recombinant selon la revendication 3 caracterise en ce qu'il 
contient egalement des signaux permettant la secretion du produit 
d' expression du ou desdits genes de structure. 

5. ADN recombinant selon les revendications 3 et 4 caracterise en ce 
que le ou les g&ies de structure codent pour des proteines d'interet 
pharmaceutique ou agroalimentaire. 

6. ADN recombinant selon la revendication 5 caracterise en ce que le 
ou les genes de structure codent pour des proteines choisies parmi les 
enzymes (tels que notamment la superoxide dismutase, la catalase, les 
amylases, les lipases, les amidases, la chymosine etc.), les derives sanguins 
(tels que la serum-albumine, l'alpha- ou la beta-globine, le facteur VIII, le 
facteur IX, le facteur de von Willebrand, la fibronectine, l'alpha-1 antitrypsine 
etc.), 1'insuline et ses variants, les lymphokines (telles que les interleukines, 
les interferons, les facteurs de stimulation des colonies (G-CSF, GM-CSF, M- 
CSF...), le TNF, le TRF etc.), les facteurs de croissance (tels que l'hormone de 
croissance, 1'erythropoietine, le FGF, I'EGF, le PDGF, le TGF etc), les 
apolipoproteines, des polypeptides antigeniques pour la realisation de 
vaccins (hepatite, cytomegalovirus, Eppstein-Barr, herpes etc.), ou encore des 
fusions de polypeptides telles que notamment des fusions comportant une 
partie active fusionnee a une partie stabilisatrice (par exemple des fusions 
entre Talbumine ou des fragments d'albumine et le recepteur ou une partie 
d'un recepteur de virus (CD4, etc.)). 
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7. ADN recombinant selon l'une quelconque des revendications 2 a 6 
caracterise en ce qu'il fait partie d'un plasmide depression, qui peut etre a 
replication autonome ou integratif. 

8. Cellule recombinee contenant une sequence d'ADN ou un ADN 
recombinant selon Tune quelconque des revendications precedentes. 

9. Cellule recombinee selon la revendication 8 caracterisee en ce qu'il 
s'agjt d'une levure. 

10. Cellule recombinee selon la revendication 9 caracterisee en ce 
qu'il s'agit d'une levure du genre Kluyveromyces. 

11. Utilisation d'une sequence d'ADN selon l'une quelconque des 
revendications 1 a 7 pour I'expression de genes recombines. 

12. Utilisation selon la revendication 11 pour I'expression de genes 
codant pour des proteines d'interet pharmaceutique ou agroalimentaire. 

13. Procede de production de proteines recombinantes caracterise en 
ce que l'on cultive une cellule recombinee selon l'une quelconque des 
revendications 8 a 10 et on recupere les proteines produites. 

14. Procede selon la revendication 13 pour la production de proteines 
d'interet pharmaceutique ou agroalimentaire. 

15. Procede selon la revendication 14 caracterise en ce que la proteine 
est preferentiellement la serum-albumine humaine ou un de ses variants 
moleculaires. 
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